• AI搜DeepSeek-R1
    帮你解答跳转解答
  • 登录百度帐号 交易更有保障

    登录百度帐号 认准 标,百度为您提供权益保障

    查看 《保障服务协议》 免保范围

    发生欺诈? 申请保障

    加入商家保障 获得

收起工具时间不限所有网页和文件站点内检索
搜索工具
百度为您找到以下结果

深度强化学习 - 百度百科

深度强化学习强化学习的最新相关信息

以优良作风凝心聚力、干事创业
连日来,各中央企业教育引导党员干部把学习教育与中心工作结合起来,确保学习教育取得实实在在的成效。中国航天科技集团党组提出“约束是底线、自觉是目标”的工作要求,形成...
人民日报
7小时前
播报
暂停
边学边练,推理觉醒:LUFFY让强化学习即学即用!
这就好比AI 模型训练中长期存在的两种极端:「模仿学习」只顾照搬示范却缺乏自我实践,「强化学习」一味自我探索却不借鉴现有经...
新浪昨天11:41
播报
暂停
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源
强化学习突破多模态感知极限|开源 于恩 投稿 量子位 | 公众号 QbitAI 超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦! 华中科技大学、北京...
新浪新闻3天前
播报
暂停
2024年11月24日 强化学习(Reinforcement Learning, RL)和深度学习(Deep Learning, DL)是人工智能领域的两个重要分支,二者既有显著差异,又在实际应用中常结合使用。强化学习侧...
2025年3月24日 近端策略优化(PPO):通过限制策略更新的幅度,提高学习稳定性,是当前常用的强化学习算法。 深度确定性策略梯度(DDPG):适用于连续控制任务的强化学习方法。 3....
播报
暂停
2024年7月13日 深度强化学习(Deep Reinforcement Learning,DRL)是人工智能(AI)研究的一个重要方向,结合了深度学习(Deep Learning)和强化学习(Reinforcement Learning)的优势。通过深度强化...
播报
暂停

强化学习(学习方法) - 百度百科

Deep Q-Network(DQN):DQN是一种结合了深度学习强化学习(特别是Q-learning)的算法,它通过使用深度神经网络来近似Q值函数,从而能够处理具有高维状态空间的问题。DQN维护两个相同的神经网络:一个是用于决策的在线网络,另一个是用于计算目标Q值的目标...
播报
暂停

深度强化学习强化学习 - 相关论文(共25750篇) - 百度学术

强化学习:由于不需要训练深度神经网络,算法相对简单且易于实现。 深度强化学习:需要训练深度神经网络,算法复杂度较高,对计算资源和时间的需求也更大。 应用场景 强化学习:适...
2023年12月27日 深度强化学习(DRL)是深度学习与强化学习的结合,在其中,深度学习主要用于对状态空间和动作空间的表示和学习,而强化学习主要用于对目标任务的优化。DRL已经在一系列复杂...
播报
暂停
2024年7月30日 强化学习旨在通过智能体与环境交互学习最优策略以最大化累积奖励,涉及状态、动作、策略等要素,马尔可夫决策过程描述其交互,深度强化学习结合二者应对复杂情况,虽有挑战但前景...
播报
暂停